"""
作者：李聪
日期：2021年 10月 30日
"""
import pandas as pd
import numpy as np
df1 = pd.read_csv('附件1',encoding='gbk')
# 删除缺失值 - dropna
df1.dropna(inplace = True)
b = df1['列名'].dropna()
# drop方法：可直接用于Series，Dataframe
# 注意inplace参数，默认False → 生成新的值
print(df1.isnull().sum())
#打印缺值数目
df1.fillna('填充值',inplace = True)
# df1.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
# value：填充值
# 注意inplace参数
df1['列名'].fillna(method = 'pad',inplace = True)
# method参数：
# pad / ffill → 用之前的数据填充 
# backfill / bfill → 用之后的数据填充
df1.replace(np.nan,'填入值',inplace = True)
# df.replace(to_replace=None, value=None, inplace=False, limit=None, regex=False, method='pad', axis=None)
# to_replace → 被替换的值
# value → 替换值
df1.replace('替代值',np.nan,inplace = True)
# 多值用np.nan代替
